36. 特征和分类

特征和分类

什么是特征?

特征可以被简单定义为某个东西的“归纳”。因此图像的特征在本质上只是图像数据的简要归纳。此外,就像图像实际上只是阵列中的数字集合一样,特征也是阵列中的另一个数字集合,但这个集合往往比图像的集合小得多。

那么这是什么意思?简单来说,撇开图像,我们以人类为例。一个人有很多特征面,我们很难全面地描述一个人。

然而,我们可以从一个人身上提取哪些简要特征?之所以选择“简要”这个词,是因为我们想用这些特征来描述这个人的某些方面,同时这个描述应该是某些相关信息的概括。

例如,如果我们想把拳击手放到他们的体重类中,我们可能想要对每个拳击手进行特征提取。我们将提取一个二维特征:身高和体重(两者都用来确定一个体重类。)

从这个意义上说,这些是“特征”,因为它们很好地 忽略了不相关 ;它们描述了一个人的体重和身高,这些特征对于将拳击手安置在适当的体重类中是有用的,它们也忽略了诸如肤色或者说头发长度等特征。所以从这个意义上来说, 特征提取 是提取相关信息的一种方式,同时也巧妙地忽略了不相关的信息。一个很好的特征是非常简洁。

特征是图像中独特和可衡量的信息。我们将具体通过几个示例,来谈谈特征以及如何检测它们。计算机视觉方面的突破之一来自于能够自动提取好的特征。但是,你也可以自己手动执行此操作。

打个比方,如果我们想把拳击手按体重分类,我们可能会提取每个拳击手的特征。在这里我们将提取一个二维特征:身高和体重(这两者都用来确定体重分类。)

这些数据之所以是“特征”,是因为它们很好地 忽略了无关信息 。它们描述了一个人的体重和身高,这些特征能有效将拳击手归纳到正确的体重组中。同时它们也忽略了诸如肤色或头发长度等无关特征。所以从这个方面来说, 特征提取 是一种提取相关信息、同时巧妙地忽略无关信息的方法。好的特征非常简明。

特征是图像中独特、可测量的信息片段。我们将探究几个示例,并学习如何检测它们。计算机视觉的一个重要突破实际上就来自于自动计算好的特征。不过你也可以自己手动计算。